Length | Sentence |
---|---|
15 | او أي شيء آخر». |
15 | هذه هي الحقيقة. |
15 | اللهم عليك بهم. |
15 | لك الله يا مصر. |
15 | واضاف "انا هنا. |
15 | و السلام عليكم. |
15 | اما حول اليورو. |
15 | يا محمد يا علي. |
15 | وفي العام 2003. |
15 | مؤسس حركة حماس. |
Length | Sentence |
---|---|
17 | كنا نحبك و نقدرك! |
17 | اعتقلوا بوش الان! |
17 | النار تحت الرماد! |
18 | ويتمنون ضرب إيران! |
19 | أين أنت يا أخي نجم! |
20 | إجرام وبأي صورة كان! |
20 | بسبب خلاف بين أطفال! |
22 | و"الاستثمار في الغاز"! |
Length | Sentence |
---|---|
18 | تحديد هوية حاملها? |
19 | هل من نار حزب الله? |
19 | الجيش السوري الحرّ? |
20 | التمييز بين الصوتين? |
20 | أي أصناف البشر أنتم? |
20 | نائب رئيس البراغواي? |
22 | 14 - شعب مع حكامه اذا? |
Here we see the absolutely shortest sentences in the corpus. In three tables we find declarative, exclamatory and interrogative sentences.
The sentences give some insight into the language or the corpus. Moreover, in the case of malformed sentences they may give hints for better preprocessing.
We find only sentences which were accepted by the preprocessing. For language detection, usually a minimum number of known words is necessary. Because of this, some very short sentences may be missing in the corpus.
select char_length(sentence) as le, sentence from sentences where sentence like "%!" and 40>length(sentence) order by le limit 15;
4.1.2 Sentences of fixed length I
4.1.3 Sentences of fixed length II
4.1.4 Sentences of fixed length III
4.1.5 Longest sentences